Chapitre 8 Régression linéaire simple

Au Chapitre 1, la droite des moindres carrés et le coefficient de corrélation sont présentés comme techniques purement descriptives: on observe deux variables, Y, la variable dite endogène; et X, la variable exogène, et X doit servir à expliquer et prédire Y. Nous nous sommes limités à une description de la relation entre deux variables dans l’échantillon et à proposer une équation destinée à exprimer la relation entre X et Y.


Or l’échantillon n'a d'intérêt que dans la mesure où il reflète une réalité qui dépasse les données de l’échantillon, la population. Considérons, par exemple, un échantillon de sujets réunis afin d’évaluer l’effet du sel sur la pression artérielle.  Supposons, pour simplifier, que les sujets sont en plusieurs points comparables : même âge, même condition physique, même style de vie, même sexe.  On observe, pour chaque sujet, une mesure x de sa consommation de sel et une mesure y de sa pression systolique, puis on détermine la droite de régression (après avoir vérifié graphiquement que la relation, s’il y en a une, est linéaire).  Le coefficient b1 de x estime ce que chaque unité supplémentaire de sel contribue à la hausse (ou la baisse, s’il se trouve que b1 est négatif) de la pression artérielle. Mais b1 n’est qu’une estimation, dans le sens que si on considérait un nombre infini de sujets semblables (la population), on pourrait découvrir que la valeur du coefficient—la « vraie » valeur, qu’on désigne par β1—est fort différente de b1. 
Un échantillon comporte un risque plus grand encore : le risque de découvrir un effet qui n’existe pas. 
On discutera dans ce chapitre trois questions incontournables.  Nous les exprimons dans le contexte de l’exemple cité ci-dessus :

Bien qu’on présente souvent la régression comme un outil de prédiction, le fait est que cet objectif est souvent secondaire. Plusieurs études scientifiques cherchent avant tout à montrer que deux variables sont liées. Le seul fait de rejeter Ho est une découverte scientifiquement intéressante. Mais pour des raisons pratiques, on s’intéressera également à β1.  Il ne suffit pas de conclure que β1 ≠ 0.  Si on estime que β1 = 0,01, cela veut dire qu’un gramme de sel de plus entraîne une augmentation de pression de 0,01 mmHg.  La relation est statistiquement significative, mais négligeable et pratiquement sans intérêt. Les deux dernières questions importent moins.